Mentalidad emergente de agentes SWE: un viaje de comprensión de código
Explora cómo los agentes SWE desarrollan su mentalidad al comprender código real. Estudio con 408 trayectorias revela patrones de navegación, evidencia y parada.
Explora cómo los agentes SWE desarrollan su mentalidad al comprender código real. Estudio con 408 trayectorias revela patrones de navegación, evidencia y parada.
Descubre SW-A2-Bench, el primer benchmark que evalúa la generación de agentes de software autónomos a partir de código, impulsando la Web Agentica y la colaboración multi-agente.